• 2021 - 2022
  • Traitement Automatique des Langues

Objectifs

A partir des données extraites dans la BàO3 (extraction des relations de dépendance), visualisation de ces relations lexicales sous forme de graphe

  • Comme le corpus est relativement large, après le traitement d'annotation et d'étiquetage, il n'est pas encore facile à interpréter. De ce fait, nous allons visualer les relations syntaxico-lexicales en forme graphique pour les mieux analyser.

  • Pour cela, nous devons faire appel à l'outil développé par Pierre Magistry(consultez ce lien).

Visualisation et interprétation

Après le traitement, nous pouvons obtenir un graphique de 5935 nœuds et de 9872 bords. Il contient 65 gouverneurs, 21 dépendances et 210 obj.

Cette image représente les relations syntaxico-lexicales du fil RSS 3210, soit la rubrique internationale. En classifiant les nœuds par type, nous allons trouver que crise est le mot le plus dépendant dans notre corpus (c'est-à-dire, celui qui se trouve le plus souvent dans la position d'objet). Il est apparu 4778 fois, sachant que le mot gouvernement, le deuxième objet le plus fréquent n'apparaît que 2651, à peu près de la moitié de la fréquence de la crise. Signifie-t-il que la communauté internationale navigue dans des crises dans l'année 2021 ? Au moins, il montre la direction d'une analyse plus profonde.